<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   Editor: R语千寻第三期：张无忌究竟爱谁？  | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript">
   MathJax.Hub.Config({
          tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]},
          TeX: {equationNumbers: {autoNumber: "AMS"}}
        });
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://cos.name/2016/06/r%E8%AF%AD%E5%8D%83%E5%AF%BB%E7%AC%AC%E4%B8%89%E6%9C%9F%EF%BC%9A%E5%BC%A0%E6%97%A0%E5%BF%8C%E7%A9%B6%E7%AB%9F%E7%88%B1%E8%B0%81%EF%BC%9F/",
                  host: "http://cos.name",
                  prePath: "http://cos.name",
                  scheme: "http",
                  pathBase: "http://cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466437166: Accept with keywords: (title(0.25):中国,统计学,服务平台,门户网站, topn(0.166666666667):少女,表妹,R语言,溶溶,长春,主角,真人,模型,自然段,分词,俗念,峨眉,可视化,姑射,文章,向量,人物,天姿,词语,梨花,编辑部,出场,郡主,群芳,关系,文本,教主,评论,聚类,意气).-->
 </head>
 <body class="single single-post postid-12636 single-format-standard sidebar" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    Editor: R语千寻第三期：张无忌究竟爱谁？
   </h1>
  </div>
  <div class="container" id="xmain">
   <div class="hfeed site" id="page">
    <header class="site-header" id="masthead" role="banner">
     <div id="cos-logo">
      <a href="http://cos.name/">
       <img src="http://cos.name/wp-content/themes/COS-kermesinus/images/headers/cos-logo.png"/>
      </a>
     </div>
     <div class="navbar" id="navbar">
      <nav class="navigation main-navigation" id="site-navigation" role="navigation">
       <h3 class="menu-toggle">
        菜单
       </h3>
       <a class="screen-reader-text skip-link" href="http://cos.name/2016/06/r%E8%AF%AD%E5%8D%83%E5%AF%BB%E7%AC%AC%E4%B8%89%E6%9C%9F%EF%BC%9A%E5%BC%A0%E6%97%A0%E5%BF%8C%E7%A9%B6%E7%AB%9F%E7%88%B1%E8%B0%81%EF%BC%9F/#content" title="跳至内容">
        跳至内容
       </a>
       <div class="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95-container">
        <ul class="nav-menu" id="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95">
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-4746" id="menu-item-4746">
          <a href="http://cos.name">
           主页
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-8120" id="menu-item-8120">
          <a href="http://cos.name/cn">
           论坛
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8124" id="menu-item-8124">
            <a href="http://cos.name/cn/wp-login.php?action=register">
             论坛注册
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8125" id="menu-item-8125">
            <a href="http://cos.name/cn/wp-login.php">
             论坛登录
            </a>
           </li>
          </ul>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8110" id="menu-item-8110">
          <a href="http://cos.name/books/">
           图书资料
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8112" id="menu-item-8112">
          <a href="http://cos.name/videos">
           视频教程
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8333" id="menu-item-8333">
          <a href="http://cos.name/salon/">
           统计沙龙
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8111" id="menu-item-8111">
          <a href="http://cos.name/chinar/">
           R语言会议
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8109" id="menu-item-8109">
          <a href="http://cos.name/training/">
           讲座与培训
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8115" id="menu-item-8115">
          <a href="http://cos.name/cn/forum/comprehensive/job/">
           招聘信息
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-4780" id="menu-item-4780">
          <a href="http://cos.name/about">
           关于我们
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8113" id="menu-item-8113">
            <a href="http://cos.name/2008/11/how-to-work-with-cos/">
             加入我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8119" id="menu-item-8119">
            <a href="http://cos.name/donate/">
             赞助我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8114" id="menu-item-8114">
            <a href="http://cos.name/cn/forum/26">
             项目合作
            </a>
           </li>
          </ul>
         </li>
        </ul>
       </div>
       <form action="http://cos.name/" class="search-form" method="get" role="search">
        <label>
         <span class="screen-reader-text">
          搜索：
         </span>
        </label>
       </form>
      </nav>
      <!-- #site-navigation -->
     </div>
     <!-- #navbar -->
    </header>
    <!-- #masthead -->
    <div class="site-main" id="main">
     <div class="content-area" id="primary">
      <div class="site-content" id="content" role="main">
       <article class="post-12636 post type-post status-publish format-standard hentry category-website tag-1065 tag-1064 tag-996" id="post-12636">
        <header class="entry-header">
         <h1 class="entry-title">
          R语千寻第三期：张无忌究竟爱谁？
         </h1>
         <div class="entry-meta">
          <span class="date">
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/" rel="bookmark" title="链向R语千寻第三期：张无忌究竟爱谁？的固定链接">
            <time class="entry-date" datetime="2016-06-18T08:01:08+00:00">
             2016/06/18
            </time>
           </a>
          </span>
          <span class="categories-links">
           <a href="http://cos.name/category/website/" rel="category tag">
            统计之都
           </a>
          </span>
          <span class="tags-links">
           <a href="http://cos.name/tag/%e5%80%9a%e5%a4%a9%e5%b1%a0%e9%be%99%e8%ae%b0/" rel="tag">
            倚天屠龙记
           </a>
           、
           <a href="http://cos.name/tag/%e5%bc%a0%e6%97%a0%e5%bf%8c/" rel="tag">
            张无忌
           </a>
           、
           <a href="http://cos.name/tag/%e6%96%87%e6%9c%ac%e5%88%86%e6%9e%90/" rel="tag">
            文本分析
           </a>
          </span>
          <span class="author vcard">
           <a class="url fn n" href="http://cos.name/author/editor/" rel="author" title="查看所有由COS编辑部发布的文章">
            COS编辑部
           </a>
          </span>
         </div>
         <!-- .entry-meta -->
        </header>
        <!-- .entry-header -->
        <div class="entry-content">
         <p>
          <strong>
           作者
          </strong>
          ：朱雪宁
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/图片-1.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/图片-1.png"/>
          </a>
          金庸的射雕三部曲，我最爱的是收官作《倚天屠龙记》。金老爷子在后记里曾说，三部曲中郭靖诚朴质实，杨过深情狂放，张无忌的个性却比较复杂，也是比较软弱。就我看来，这种软弱的一方面体现在他对爱情的选择困难症上。
         </p>
         <p>
          幼时蝴蝶谷初遇殷离，便被一见钟情，后有婚诺之约；年少汉水舟中邂逅周芷若，后来互生情愫，几成良缘；光明顶遇小昭，意存怜惜，却终天人永隔；绿柳山庄遇赵敏，针锋相对，但也一生羁绊。张无忌本人态度比较暧昧，可以说是经过朱九真爱情滑铁卢之后一路上运势基本开挂，但他性格里却是拖泥带水，见异思迁，放到现在基本称得上是渣男中的战斗渣。张无忌究竟爱谁？这是一个被争得沸沸扬扬的问题，说实话，有一千个读者，就有一千个最爱。连金老爷子最后也只得承认：恐怕作者也难以说清。但是，真的说不清吗？我心血来潮，拿倚天屠龙记小说做了一把文本分析。
         </p>
         <p>
          <span id="more-12636">
          </span>
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/图片-2.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/图片-2.png"/>
          </a>
         </p>
         <ol>
          <li>
           数据预处理
          </li>
         </ol>
         <p>
          想要找倚天屠龙记的文本并不难，直接度娘打死都不能说的“倚天屠龙记 txt”即可【1】。我们先读进R来一探究竟（用readLines）:
         </p>
         <pre>yitian = readLines("倚天屠龙记.Txt")

yitian[1:10]</pre>
         <pre>##  [1] "                         一　  天涯思君不可忘"                                 
 ##  [2] "    “春游浩荡，是年年寒食，梨花时节。白锦无纹香烂漫，玉树琼苞堆雪。静夜沉沉，" 
 ##  [3] "浮光霭霭，冷浸溶溶月。人间天上，烂银霞照通彻。浑似姑射真人，天姿灵秀，意气殊高"
 ##  [4] "洁。万蕊参差谁信道，不与群芳同列。浩气清英，仙才卓荦，下土难分别。瑶台归去，洞"
 ##  [5] "天方看清绝。”"                                                                 
 ##  [6] "    作这一首《无俗念》词的，乃南宋末年一位武学名家，有道之士。此人姓丘，名处机"
 ##  [7] "，道号长春子，名列全真七子之一，是全真教中出类拔萃的人物。《词品》评论此词道："
 ##  [8] "“长春，世之所谓仙人也，而词之清拔如此”。这首词诵的似是梨花，其实词中真意却是"  
 ##  [9] "赞誉一位身穿白衣的美貌少女，说她“浑似姑射真人，天姿灵秀，意气殊高洁”，又说她"  
 ## [10] "“浩气清英，仙才卓荦”，“不与群芳同列”。词中所颂这美女，乃古墓派传人小龙女。"</pre>
         <p>
          看到这个数据形式小编也有点傻眼，一个自然段原来被分成了好多行存储（例如上图2-5行属于同一自然段），每一行长度也有所差异。鉴于同一自然段的表意比较完整，我们先并行成段。不难注意到每个自然段的开端都有空格，我们可以利用这个特性把每段首行对应的index提出来，据此分段如下，共得到4614段。
         </p>
         <pre>para_head = grep("\\s+", yitian)
cut_para1 = cbind(para_head[1:(length(para_head)-1)], para_head[-1]-1)
yitian_para = sapply(1:nrow(cut_para1), function(i) paste(yitian[cut_para1[i,1]:cut_para1[i,2]], collapse = ""))
yitian_para[1:4]

## [1] "一　  天涯思君不可忘"                                                          
 ## [2] "“春游浩荡，是年年寒食，梨花时节。白锦无纹香烂漫，玉树琼苞堆雪。静夜沉沉，浮光霭霭，冷浸溶溶月。人间天上，烂银霞照通彻。浑似姑射真人，天姿灵秀，意气殊高洁。万蕊参差谁信道，不与群芳同列。浩气清英，仙才卓荦，下土难分别。瑶台归去，洞天方看清绝。”"                                                                            ## [3] "作这一首《无俗念》词的，乃南宋末年一位武学名家，有道之士。此人姓丘，名处机，道号长春子，名列全真七子之一，是全真教中出类拔萃的人物。《词品》评论此词道：“长春，世之所谓仙人也，而词之清拔如此”。这首词诵的似是梨花，其实词中真意却是赞誉一位身穿白衣的美貌少女，说她“浑似姑射真人，天姿灵秀，意气殊高洁”，又说她“浩气清英，仙才卓荦”，“不与群芳同列”。词中所颂这美女，乃古墓派传人小龙女。她一生爱穿白衣，当真如风拂玉树，雪裹琼苞，兼之生性清冷，实当得起“冷浸溶溶月”的形容，以“无俗念”三字赠之，可说十分贴切。长春子丘处机和她在终南山上比邻而居，当年一见，便写下这首词来。"
 ## [4] "这时丘处机逝世已久，小龙女也已嫁与神雕大侠杨过为妻。在河南少室山山道之上，却另有一个少女，正在低低念诵此词。这少女十八九岁年纪，身穿淡黄衣衫，骑着一头青驴，正沿山道缓缓而上，心中默想：“也只有龙姊姊这样的人物，才配得上他。”这一个“他”字，指的自然是神雕大侠杨过了。她也不拉缰绳，任由那青驴信步而行，一路上山。过了良久，她又低声吟道：“欢乐趣，离别苦，就中更有痴儿女。君应有语，渺万里层云，千山暮雪，只影向谁去？”"</pre>
         <p>
          单有文本数据还不成，得再把今天的主角列出来（如下），其中每一行代表人物的不同称谓，用同样的方式我们可以读入R环境中。
         </p>
         <pre>roles = readLines("主角名单.txt")
roles[1:5]

 ## [1] "殷离 蛛儿 表妹 丑姑娘 丑八怪"                  
 ## [2] "周芷若 芷若 周姑娘 周掌门 周师妹 周姊姊 宋夫人"
 ## [3] "赵敏 郡主 小妖女 敏妹 敏敏 赵姑娘"             
 ## [4] "小昭 小丫头"                                   
 ## [5] "张无忌 无忌 曾阿牛 阿牛哥 公子 张教主"</pre>
         <ol start="2">
          <li>
           人物分析
          </li>
         </ol>
         <p>
          划分自然段之后，我们可以算算每个角色出现的自然段的数目。这里，我们需要把不同称谓都对应于同一人物（用grep函数进行匹配）。毋庸置疑，正牌男主角张无忌出现的次数最多，后面依次是赵敏、周芷若、殷离、小昭。其中，对于赵敏和周芷若的着墨可以说是难分伯仲。金老爷子对两者的性格塑造也各有不同，一个泼辣浓郁，一个气若仙姝，两者都是绝色美人，都有一定的政治才能，实难抉择。
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/7.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/7.png"/>
          </a>
         </p>
         <pre>roles1 = paste0("(", gsub(" ", ")|(", roles), ")")
main_roles = c("殷离","周芷若","赵敏","小昭", "张无忌")
role_para = sapply(roles1[1:5], grepl, yitian_para)
colnames(role_para) = main_roles

role_count = data.frame(role = factor(colnames(role_para), levels = c("张无忌", "赵敏","周芷若", "殷离","小昭")), count = colSums(role_para))</pre>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/8.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/8.png"/>
          </a>
         </p>
         <p>
          我们再来看看出场密度统计。如果我们把每个人物出场的自然段按照顺序排列，那就不难给出每个人物的出场密度估计，为了简单起见，我们这里只给出前面戏份最重的三个主角：张无忌、赵敏、周芷若。可以看出，作者对男主张无忌的着墨算是比较均匀，而对周芷若、赵敏的安排却差别迥异。汉水初遇周芷若，那时他们还是不谙世事的年纪。后来芷若被张三丰送入峨眉门下，多年之后光明顶重逢张无忌，此时她是峨眉名门正徒，他是武当名门之后。可以说，无论从出身、还是从往日旧情、旧义上讲，都是郎才女貌、门当户对的一对儿。而对于赵敏来说，她的出场几乎出在全文的中后期，此时一没有旧情好讲，二没有出身好论，不巧的还是各大门派同仇敌忾的阶级敌人。可以说，她手上的牌不能再糟糕了。
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/9.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/9.png"/>
          </a>
          <a href="http://cos.name/wp-content/uploads/2016/06/10.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/10.png"/>
          </a>
         </p>
         <p>
          不过，尽管如此，wuli敏敏郡主的实力却不容小觑。事实上，上述四位佳人都与男主有过情感纠葛，但程度却难以界定，能不能通过她们与张教主同时出场的次数来刻画亲密程度呢？刚才提到，自然段是表意基本单元，同一自然段意义相近，中心一致。因此，可以定义她们与教主的亲密值：与张教主出现在同一自然段的次数。这个计算非常简单，只需要基本的矩阵运算。结果表明，虽然敏敏郡主出场不利，但是还是制造了更多跟教主亲密接触的机会，可以说是战斗力爆表。
         </p>
         <pre>colSums(role_para[,5]*role_para[,1:4])
role_count1 = data.frame(role = factor(colnames(role_para)[1:4]), 
 count = colSums(role_para[,5]*role_para[,1:4]))</pre>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/11.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/11.png"/>
          </a>
         </p>
         <ol start="3">
          <li>
           称谓变化
          </li>
         </ol>
         <p>
          从上面的称谓信息上来看，除了小昭的称谓比较单调之外，其他角色都有着不同称谓变化。以殷离为例，我们可以看到她在全书中称谓的变化。殷离刚出场时，金庸对其描述是“面容黝黑，脸上肌肤浮肿，凹凹凸凸，生得极是丑陋”，因此在初期时“丑八怪”是对她的刻画。而后来她的真实身份曝光，才知道她其实是殷野王之女，与张无忌是表妹之亲。因此这也就不难猜到为何在后期“殷离”和“表妹”占主要比例。
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/14.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/14.png"/>
          </a>
         </p>
         <p>
          我们再来看看周芷若和赵敏的称谓变化。为了体现她们与张无忌关系中的称谓变化，这里只保留曾出现张无忌的自然段（这并不是一个完美的解决方案，但是是一个凑合的解决方案）。其中，周芷若的称谓变化如下图所示。可以看出，开始 “周姑娘” 和“芷若”前期出现较多，可以说是比较尊敬和亲昵的称谓。而后期随着周芷若为完成师父遗命做出种种（偷倚天剑、屠龙刀，试图杀害殷离并嫁祸赵敏），人设逐步转黑。我们也逐渐看到，更有距离感的称谓，例如周掌门、宋夫人后期频出。这也象征着她与张无忌在后期的人生道路上渐行渐远。
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/13.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/13.png"/>
          </a>
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/15.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/15.png"/>
          </a>
         </p>
         <p>
          我们再来看看赵敏的各个称谓在各自然段分布结果（注意，这里横轴显示的是从赵敏出场开始到结束的分析结果）。可以看到，前期诸如 “赵姑娘”、“赵敏”等尊称占主要部分（注意到，这些称谓是存在心理上的距离感的），而后期来说，比较亲昵的称呼，例如“敏妹”、“敏敏”开始出场较为频繁，其主要原因是两人关系逐渐缓和。赵敏是一个有强烈自我意识的姑娘，为了追求爱情，她可以抛下所有，包括政治立场，家国天下，基本可以总结为疯狂爱爱爱。但是她又不是一个疯狂到冲昏了头脑的人，整个过程中她曾经被诬陷、被误解，但她最过人之处在于，在最糟的情况下仍然保持准确的判断和清醒的决策，这一点从她被周芷若嫁祸后再遇张无忌直至抢亲的一系列表现中可以看出。
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/16.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/16.png"/>
          </a>
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/17.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/17.png"/>
          </a>
         </p>
         <ol start="4">
          <li>
           人以群分
          </li>
         </ol>
         <p>
          之前描述分析已经基本反映本书主角之间相爱相杀的关系，那么，我们能不能用语义模型做一些分析呢。为此，我选择了这两年比较火的“词向量”模型，简而言之，该模型通过对语料进行神经网络的训练，可以把每个词映射到低维向量空间，词语之间的相近关系可以用向量的cosine夹角表示。其模型推演及训练的科普帖请见【2】。前两年谷歌公开了通过神经网络训练词向量的开源工具word2vec【3】，并被多种语言版本实现【4】，我在此使用的是R语言封装的版本wordVectors包【5】。
         </p>
         <p>
          由于中文的特殊性（不像英文一样词语之间以空格分隔），训练词向量需要先对文本进行分词。在分词的过程中，我们需要去除停用词（比如“的”、“了”等表意特征不明显的词）。R语言中的分词墙裂推荐使用jiebaR包【6】，几乎是其他分词R包效率的5-20倍。同时，此包支持用户自己添加词典，我们可以将人名等专有名词添加到词库中。
         </p>
         <pre>library(jiebaR)
cutter = worker(bylines = TRUE, stop_word = "stop.txt")
new_user_word(cutter, unlist(rolesl), rep("n", length(unlist(rolesl)))) ### insert new words

yitian_words = cutter[yitian_para]
yitian_split = sapply(yitian_words, paste, collapse = " ")
writeLines(yitian_split, "yitian_split.txt")</pre>
         <p>
          分词后，我们将词语以空格分隔输入到txt文档，并用word2vec进行训练。我们可以看看跟几个主角关系最近的都有什么词语。尽管小编对有一些词语结果也是不明觉厉，不过从中我们可以看到几个主角的大名和人物关系，例如，赵敏的另外称谓是郡主，一开始范遥是她的随从；周芷若属于峨眉一派，其师为灭绝师太。
         </p>
         <pre>library(wordVectors)
model = train_word2vec("yitian_split.txt", output="yitian_split.bin", 
 threads = 3, vectors = 100, window=12, force = T)
vec = read.vectors("yitian_split.bin")

nearest_to(model,model[["张无忌"]])
nearest_to(model,model[["赵敏"]])
nearest_to(model,model[["周芷若"]])</pre>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/001_zhu.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/001_zhu.png"/>
          </a>
          进一步我们可以利用词向量结果来进行聚类（此处选择层次聚类），聚类结果有点意思，可以说表征了小说中主要的人物关系。比如说，张翠山夫妇与谢逊曾一同共处冰火岛；左边的张三丰一支为武当派主要人物；金花婆婆的女儿为小昭，徒儿是殷离；灭绝师太一支主要是峨眉派代表；中间殷天正一支为明教核心首领；而最右边为郡主府的主要随从。从这幅图上来看，虽然张无忌、赵敏、周芷若同属一支，但是张无忌与赵敏的关系却更为亲密，这也印证了他在全文终时对芷若妹子说的话：
         </p>
         <p>
          “芷若，我对你一向敬重，我对殷家表妹心生感激，对小昭是意存怜惜，可是我对赵敏却是刻骨铭心的相爱！”
         </p>
         <pre>rr = sapply(rolesl, function(x) x[1])
cos_dist = cosineDist(vec[rr],vec[rr])
hc = hclust(as.dist(cos_dist), method = "average")
plot(hc)</pre>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/18.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/18.png"/>
          </a>
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/06/19.png">
           <img src="http://cos.name/wp-content/uploads/2016/06/19.png"/>
          </a>
         </p>
         <ul>
          <li>
           <a href="http://vdisk.weibo.com/s/BDfQaBrpWWbtV">
            http://vdisk.weibo.com/s/BDfQaBrpWWbtV
           </a>
          </li>
          <li>
           <a href="http://licstar.net/archives/328">
            http://licstar.net/archives/328
           </a>
          </li>
          <li>
           <a href="https://code.google.com/archive/p/word2vec/">
            https://code.google.com/archive/p/word2vec/
           </a>
          </li>
          <li>
           <a href="https://en.wikipedia.org/wiki/Word2vec">
            https://en.wikipedia.org/wiki/Word2vec
           </a>
          </li>
          <li>
           <a href="https://github.com/bmschmidt/wordVectors">
            https://github.com/bmschmidt/wordVectors
           </a>
          </li>
          <li>
           <a href="https://github.com/qinwf/jiebaR">
            https://github.com/qinwf/jiebaR
           </a>
          </li>
         </ul>
         <p>
         </p>
         <p>
          后记：这篇文章用到的自然语言处理手段比较生硬，也比较初级。其实，文学的美是很难用简单粗暴的手段得到一个完美的解释的，有时候，相似的表意，读者所感受到的却是各有不同。在这里，我也放出倚天中的两段文字供大家赏鉴吧：
         </p>
         <p>
          一是赵敏抢亲之时：
         </p>
         <blockquote>
          <p>
           杨逍和范遥对望一眼，知她今日是存心前来搅局，无论如何要立时阻止，免得将一场喜庆大事闹得尴尬狼狈，满堂不欢。杨逍踏上两步，说道：“咱们今日宾主尽礼，赵姑娘务请自重。”他已打定了主意，赵敏若要捣乱，只有迅速出手点她穴道，制住她再说。赵敏向范遥道：“苦大师，人家要对我动手，你帮不帮我？”范遥眉头一皱，说道：“郡主，世上不如意事十居八九，既已如此，也是勉强不来了。”
          </p>
          <p>
           赵敏道：“我偏要勉强。”
          </p>
         </blockquote>
         <p>
          二是张无忌邀周芷若共同对战之时：
         </p>
         <p>
         </p>
         <blockquote>
          <p>
           周芷若冷笑道：“咱们从前曾有婚姻之约，我丈夫此刻却是命在垂危，加之今日我没伤你性命，旁人定然说我对你旧情犹存。若再邀你相助，天下英雄人人要骂我不知廉耻、水性杨花。”张无忌急道：“咱们只须问心无愧，旁人言语，理他作甚？”周芷若道：“倘若我问心有愧呢？”张无忌一呆，接不上口，只道：“你……你……”
          </p>
          <p>
           周芷若道：“张教主，咱二人孤男寡女，深宵共处，难免要惹物议。你快请罢！”
          </p>
         </blockquote>
         <p>
          原文
          <a href="http://mp.weixin.qq.com/s?timestamp=1466207999&amp;src=3&amp;ver=1&amp;signature=zR64tImItsrCvnEUEZJZM2hJv1H1o6AjQGkT5FNrTKyWW*GssZtkxaaVYvDebr08ezADxBKweIkXOOGNNywCjuVHqcrTRd4NC5a7VkittFFTy3Mb8h-rikRtPxvOpSMh9JbBiOOZtLQIXnzknkr137bTZgy84fQXikEy0JBHCgI=">
           链接
          </a>
          。
         </p>
         <p>
         </p>
         <p>
          Code链接：
          <a href="https://github.com/BearAcademy/R-Tutorial/tree/master/Lecture3">
           https://github.com/BearAcademy/R-Tutorial/tree/master/Lecture3
          </a>
         </p>
         <p>
          如果您对我们的内容感兴趣，请关注微信公众号“狗熊会”，或扫描下方二维码
         </p>
         <p>
          <a href="http://cos.name/wp-content/uploads/2016/05/8.jpg">
           <img src="http://cos.name/wp-content/uploads/2016/05/8.jpg"/>
          </a>
         </p>
         <div class="wumii-hook">
          <br/>
          <br/>
         </div>
        </div>
        <!-- .entry-content -->
        <footer class="entry-meta">
         <div class="author-info">
          <div class="author-avatar">
           <img src="http://sdn.geekzu.org/avatar/2fe058e9e383c85afa949b36e869432f?s=74&amp;d=monsterid&amp;r=g"/>
          </div>
          <!-- .author-avatar -->
          <div class="author-description">
           <h2 class="author-title">
            关于COS编辑部
           </h2>
           <p class="author-bio">
            本账户为COS编辑部公共账户，目前由朱雪宁任主编，王小宁任副主编，编辑有：冯璟烁、吴佳萍、张心雨、施涛、霍志骥、何通、冷静、尤晓斌、肖楠、邱怡轩、高涛、谢益辉等人，主要负责主站文章的规范化编辑以及相关论文、书籍、手册的整理、编纂、出版等工作。
            <a class="author-link" href="http://cos.name/author/editor/" rel="author">
             查看所有由COS编辑部发表的文章
             <span class="meta-nav">
              →
             </span>
            </a>
           </p>
          </div>
          <!-- .author-description -->
         </div>
         <!-- .author-info -->
        </footer>
        <!-- .entry-meta -->
       </article>
       <!-- #post -->
       <nav class="navigation post-navigation" role="navigation">
        <h1 class="screen-reader-text">
         文章导航
        </h1>
        <div class="nav-links">
         <a href="http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/" rel="prev">
          <span class="meta-nav">
           ←
          </span>
          利用shiny包快速搭建可视化原型系统
         </a>
        </div>
        <!-- .nav-links -->
       </nav>
       <!-- .navigation -->
       <div class="comments-area" id="comments">
        <h2 class="comments-title">
         《
         <span>
          R语千寻第三期：张无忌究竟爱谁？
         </span>
         》有2个想法
        </h2>
        <ol class="comment-list">
         <li class="comment even thread-even depth-1" id="comment-7315">
          <article class="comment-body" id="div-comment-7315">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/b42488ea45c447885832f7638f606a5a?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              <a class="url" href="http://www.zijiacha.com/category.php?id=6" rel="external nofollow">
               南糯山普洱茶
              </a>
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7315">
              <time datetime="2016-06-19T14:04:46+00:00">
               2016/06/19 14:04
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             用程序员的思维来回答“张无忌究竟爱谁？”，果然让人不明觉厉！
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给南糯山普洱茶" class="comment-reply-link" href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/?replytocom=7315#respond" onclick='return addComment.moveForm( "div-comment-7315", "7315", "respond", "12636" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
         <li class="comment odd alt thread-odd thread-alt depth-1" id="comment-7316">
          <article class="comment-body" id="div-comment-7316">
           <footer class="comment-meta">
            <div class="comment-author vcard">
             <img src="http://sdn.geekzu.org/avatar/f0aed16fd90d549e0a1e72773197a43d?s=74&amp;d=monsterid&amp;r=g"/>
             <b class="fn">
              胡家新
             </b>
             <span class="says">
              说道：
             </span>
            </div>
            <!-- .comment-author -->
            <div class="comment-metadata">
             <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7316">
              <time datetime="2016-06-20T14:44:12+00:00">
               2016/06/20 14:44
              </time>
             </a>
            </div>
            <!-- .comment-metadata -->
           </footer>
           <!-- .comment-meta -->
           <div class="comment-content">
            <p>
             代码的可读性还是差了点，希望下次能多加备注
            </p>
           </div>
           <!-- .comment-content -->
           <div class="reply">
            <a aria-label="回复给胡家新" class="comment-reply-link" href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/?replytocom=7316#respond" onclick='return addComment.moveForm( "div-comment-7316", "7316", "respond", "12636" )' rel="nofollow">
             回复
            </a>
           </div>
          </article>
          <!-- .comment-body -->
         </li>
         <!-- #comment-## -->
        </ol>
        <!-- .comment-list -->
        <div class="comment-respond" id="respond">
         <h3 class="comment-reply-title" id="reply-title">
          发表评论
          <small>
           <a href="http://cos.name/2016/06/r%E8%AF%AD%E5%8D%83%E5%AF%BB%E7%AC%AC%E4%B8%89%E6%9C%9F%EF%BC%9A%E5%BC%A0%E6%97%A0%E5%BF%8C%E7%A9%B6%E7%AB%9F%E7%88%B1%E8%B0%81%EF%BC%9F/#respond" id="cancel-comment-reply-link" rel="nofollow" style="display:none;">
            取消回复
           </a>
          </small>
         </h3>
         <form action="http://cos.name/wp-comments-post.php" class="comment-form" id="commentform" method="post" novalidate="">
          <p class="comment-notes">
           <span id="email-notes">
            电子邮件地址不会被公开。
           </span>
           必填项已用
           <span class="required">
            *
           </span>
           标注
          </p>
          <p class="comment-form-comment">
           <label for="comment">
            评论
           </label>
           <textarea aria-required="true" cols="45" id="comment" maxlength="65525" name="comment" required="required" rows="8">
           </textarea>
          </p>
          <p class="comment-form-author">
           <label for="author">
            姓名
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-email">
           <label for="email">
            电子邮件
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-url">
           <label for="url">
            站点
           </label>
          </p>
          <p class="form-submit">
          </p>
          <p style="display: none;">
          </p>
          <p style="display: none;">
          </p>
         </form>
        </div>
        <!-- #respond -->
       </div>
       <!-- #comments -->
      </div>
      <!-- #content -->
     </div>
     <!-- #primary -->
     <div class="sidebar-container" id="tertiary" role="complementary">
      <div class="sidebar-inner">
       <div class="widget-area">
        <aside class="widget widget_text" id="text-3">
         <h3 class="widget-title">
          关注统计之都
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            新浪微博
            <a href="http://weibo.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            人人网
            <a href="http://renren.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            Twitter
            <a href="http://twitter.com/cos_name">
             @cos_name
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-6">
         <h3 class="widget-title">
          微信公众平台
         </h3>
         <div class="textwidget">
          <img src="http://cos.name/wp-content/uploads/2013/04/qrcode-8cm.jpg"/>
          <p style="font-size:12px;margin-left:15px">
           微信号 CapStat
          </p>
          <p>
           我们将第一时间向您推送主站和论坛的精彩内容，以及统计之都的线下活动、竞赛、培训和会议信息。
          </p>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-8">
         <h3 class="widget-title">
          站内导航
         </h3>
         <div class="textwidget">
          <ul>
           <li class="page_item">
            <a href="http://cos.name/cn/">
             中文论坛
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/videos/">
             视频
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/salon/">
             统计沙龙
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/books/">
             图书出版
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/training/">
             教育培训
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/about/">
             关于我们
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/donate/">
             捐赠
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/chinar/">
             R语言会议
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_links" id="linkcat-2">
         <h3 class="widget-title">
          友情链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://stat.ruc.edu.cn" target="_blank" title="中国人民大学统计学院网站">
            中国人民大学统计学院
           </a>
          </li>
          <li>
           <a href="http://rucdmc.net">
            中国人民大学数据挖掘中心
           </a>
          </li>
          <li>
           <a href="http://birc.gsm.pku.edu.cn/" target="_blank">
            北京大学商务智能研究中心
           </a>
          </li>
          <li>
           <a href="http://sam.cufe.edu.cn/" target="_blank" title="中央财经大学统计与数学学院网站">
            中央财经大学统计与数学学院
           </a>
          </li>
          <li>
           <a href="http://tjx.cueb.edu.cn/" target="_blank" title="首都经济贸易大学统计学院网站">
            首经贸统计学院
           </a>
          </li>
          <li>
           <a href="http://www.shookr.com/">
            数客网大数据社区
           </a>
          </li>
          <li>
           <a href="http://www.xueqing.tv/" target="_blank" title="数据科学在线学习平台">
            雪晴数据网
           </a>
          </li>
          <li>
           <a href="http://iera.name/" target="_blank" title="IERA是一个旨在普及、传播和增进工业工程知识的非营利性网站">
            IERA（直通IE）
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_categories" id="categories-2">
         <h3 class="widget-title">
          全部分类
         </h3>
         <label class="screen-reader-text" for="cat">
          全部分类
         </label>
         <select class="postform" id="cat" name="cat">
          <option value="-1">
           选择分类目录
          </option>
          <option class="level-0" value="925">
           cos访谈  (4)
          </option>
          <option class="level-0" value="659">
           图书出版  (5)
          </option>
          <option class="level-0" value="379">
           数学方法  (14)
          </option>
          <option class="level-1" value="381">
           分析与代数  (1)
          </option>
          <option class="level-1" value="380">
           概率论  (9)
          </option>
          <option class="level-1" value="382">
           随机过程  (5)
          </option>
          <option class="level-0" value="210">
           数据分析  (81)
          </option>
          <option class="level-1" value="203">
           多元统计  (3)
          </option>
          <option class="level-1" value="42">
           数据挖掘与机器学习  (42)
          </option>
          <option class="level-1" value="36">
           生物与医学统计  (17)
          </option>
          <option class="level-1" value="35">
           计量经济学  (4)
          </option>
          <option class="level-1" value="296">
           金融统计  (3)
          </option>
          <option class="level-1" value="303">
           风险精算  (7)
          </option>
          <option class="level-0" value="177">
           模型专题  (15)
          </option>
          <option class="level-1" value="38">
           回归分析  (10)
          </option>
          <option class="level-1" value="41">
           时间序列  (2)
          </option>
          <option class="level-0" value="784">
           每周精选  (24)
          </option>
          <option class="level-1" value="183">
           可视化  (9)
          </option>
          <option class="level-0" value="967">
           沙龙纪要  (3)
          </option>
          <option class="level-0" value="18">
           经典理论  (46)
          </option>
          <option class="level-1" value="37">
           抽样调查  (3)
          </option>
          <option class="level-1" value="4">
           统计推断  (26)
          </option>
          <option class="level-1" value="236">
           试验设计  (7)
          </option>
          <option class="level-1" value="39">
           非参数统计  (3)
          </option>
          <option class="level-0" value="1">
           统计之都  (279)
          </option>
          <option class="level-1" value="884">
           中国R会议  (2)
          </option>
          <option class="level-1" value="885">
           中国R语言会议  (5)
          </option>
          <option class="level-1" value="446">
           出国留学  (3)
          </option>
          <option class="level-1" value="179">
           推荐文章  (90)
          </option>
          <option class="level-1" value="3">
           新闻通知  (75)
          </option>
          <option class="level-1" value="263">
           统计刊物  (10)
          </option>
          <option class="level-1" value="174">
           网站导读  (40)
          </option>
          <option class="level-1" value="204">
           职业事业  (51)
          </option>
          <option class="level-1" value="213">
           高校课堂  (9)
          </option>
          <option class="level-0" value="178">
           统计计算  (28)
          </option>
          <option class="level-1" value="40">
           优化与模拟  (15)
          </option>
          <option class="level-1" value="43">
           贝叶斯方法  (6)
          </option>
          <option class="level-0" value="378">
           软件应用  (116)
          </option>
          <option class="level-1" value="44">
           统计图形  (36)
          </option>
          <option class="level-1" value="110">
           统计软件  (83)
          </option>
         </select>
        </aside>
        <aside class="widget widget_recent_comments" id="recent-comments-2">
         <h3 class="widget-title">
          最新评论
         </h3>
         <ul id="recentcomments">
          <li class="recentcomments">
           <span class="comment-author-link">
            fineboom
           </span>
           发表在《
           <a href="http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/#comment-7317">
            利用shiny包快速搭建可视化原型系统
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            胡家新
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7316">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://www.zijiacha.com/category.php?id=6" rel="external nofollow">
             南糯山普洱茶
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7315">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            J
           </span>
           发表在《
           <a href="http://cos.name/2016/05/value-of-the-reputation-from-the-data/#comment-7314">
            数据告诉你：高信誉的卖家应该收高价，还是收低价？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://gg" rel="external nofollow">
             Hilda
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2013/01/drawing-map-in-r-era/#comment-7311">
            R时代，你要怎样画地图？
           </a>
           》
          </li>
         </ul>
        </aside>
        <aside class="widget widget_rss" id="rss-282869971">
         <h3 class="widget-title">
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           <img src="http://cos.name/wp-includes/images/rss.png"/>
          </a>
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           中文论坛新帖
          </a>
         </h3>
         <ul>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417372/">
            处理时间数据和产生时间序列的问题
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/6790/">
            《统计陷阱》下载 （How to lie with statistics）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/818/">
            统计学的世界（第五版）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/16574/">
            class(x) 返回值值是AsIs,AsIs代表什么，有什么用处？
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417366/">
            如何用R绘制一个分类算法的决策规则
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_text" id="text-2">
         <h3 class="widget-title">
          登录/RSS
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <a href="http://cos.name/wp-admin/">
             登录
            </a>
           </li>
           <li>
            <a href="http://cos.name/feed/" title="使用 RSS 2.0 同步站点内容">
             文章
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
           <li>
            <a href="http://cos.name/comments/feed/" title="RSS 上的最近评论">
             评论
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
          </ul>
         </div>
        </aside>
       </div>
       <!-- .widget-area -->
      </div>
      <!-- .sidebar-inner -->
     </div>
     <!-- #tertiary -->
    </div>
    <!-- #main -->
    <footer class="site-footer" id="colophon" role="contentinfo">
     <div class="site-info">
      版权所有 © 2014 统计之都 | 由
      <a href="http://wordpress.org/">
       WordPress
      </a>
      构建 | 主题修改自
      <a href="http://wordpress.org/themes/twentythirteen">
       Twenty Thirteen
      </a>
     </div>
     <!-- .site-info -->
    </footer>
    <!-- #colophon -->
   </div>
   <!-- #page -->
   <p style="margin:0;padding:0;height:1px;overflow:hidden;">
    <a href="http://www.wumii.com/widget/relatedItems" style="border:0;">
     <img src="http://static.wumii.cn/images/pixel.png"/>
    </a>
   </p>
  </div>
 </body>
</html>